收录范围:第 0 章至第 12 章所有「学点英语」词汇表
共计 409 个核心术语,按英文字母排序
A · B · C · D · E · F · G · H · I · J · K · L · M · N · O · P · Q · R · S · T · U · V · W · Z
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 行动 | Action | /ˈækʃn/ | Agent改变环境或自身状态的行为 |
| 行动层 | Action Layer | /ˈækʃn ˈleɪər/ | 将LLM决策转化为实际工具调用的执行模块 |
| 激活函数 | Activation Function | /ˌæktɪˈveɪʃən ˈfʌŋkʃən/ | 引入非线性的关键数学操作,如ReLU |
| 智能体 | Agent | /ˈeɪdʒənt/ | 可感知环境、决策并执行动作的 AI 系统 |
| 自主检索增强生成 | Agentic RAG | /eɪˈdʒentɪk ræɡ/ | 多轮自主检索,Agent主动调整查询策略的知识获取方式 |
| 对齐 | Alignment | /əˈlaɪnmənt/ | 让AI系统的行为与人类价值观、意图和期望保持一致 |
| 类比推理 | Analogy Reasoning | /əˈnælədʒi ˈriːzənɪŋ/ | 通过向量运算发现词间关系模式的能力 |
| 指代消解 | Anaphora Resolution | /əˈnæfərə ˌrezəˈluːʃən/ | 判断代词(他/它/这个)具体指代什么 |
| 标注员 | Annotator / Labeler | /ˈænəteɪtə(r)/ | 对候选答案进行排序与质量评判的人类 |
| 应用编程接口 | API | /ˌeɪ piː ˈaɪ/ | Application Programming Interface,访问模型服务的接口协定 |
| API调用 | API Call | /ˌeɪ.piːˈaɪ kɔːl/ | 通过编程接口向AI模型发送请求并获取回复 |
| 调用API | API Calling | /ˈeɪpiːaɪ ˈkɔːlɪŋ/ | 通过API调用云端大模型,零基础设施投入的接入方式 |
| API密钥 | API Key | /ˈeɪpiːaɪ kiː/ | 调用API的身份凭证,类似密码,绝对不能公开共享 |
| 近似近邻 | Approximate Nearest Neighbor (ANN) | /əˈprɑːksɪmət ˈnɪərəst ˈneɪbər/ | 通过索引结构牺牲少量精度换取极快检索速度的算法 |
| 算术推理 | Arithmetic Reasoning | /əˈrɪθmətɪk ˈriːzənɪŋ/ | 模型执行加减乘除与多步计算的能力 |
| 人工智能 | Artificial Intelligence | /ˌɑːrtɪˈfɪʃl ɪnˈtelɪdʒəns/ | 让机器展现智能行为的技术领域,不等于大模型 |
| 助手角色 | Assistant Role | /əˈsɪstənt roʊl/ | 记录AI历史回复的messages角色 |
| 注意力机制 | Attention Mechanism | /əˈtenʃən ˈmekənɪzəm/ | 让模型在处理序列时动态关注不同位置相关信息的机制 |
| 自动生命周期 | Automatic Lifecycle | /ˌɔːtəˈmætɪk ˈlaɪfsaɪkl/ | AI应用自动管理MCP Server的启动、运行和停止 |
| 自主智能体 | Autonomous Agent | /ɔːˈtɒnəməs ˈeɪdʒənt/ | 能自主规划、长期记忆、主动发起任务的Agent |
| 自回归 | Autoregressive | /ˌɔːtoʊrɪˈɡresɪv/ | 每次基于已生成序列预测下一个词,逐步构建完整输出的生成方式 |
| 自回归生成 | Autoregressive Generation | /ɔːtoʊrɪˈɡresɪv ˌdʒenəˈreɪʃən/ | 从左到右逐词生成文本序列的过程,每一步依赖之前已生成的全部内容 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 反向传播 | Backpropagation | /ˌbækˌprɒpəˈɡeɪʃən/ | 从输出层往回计算参数的梯度 |
| 批量 | Batch | /bætʃ/ | 一次更新中使用的数据子集 |
| 光束搜索 | Beam Search | /biːm sɜːtʃ/ | 同时保留多条候选路径的最大化解码方法 |
| 广度优先搜索 | BFS (Breadth-First Search) | /bredθ fɜːrst sɜːrtʃ/ | ToT中每层探索所有可能再筛选的搜索算法 |
| 黑箱 | Black Box | /blæk bɒks/ | 内部机制不可见、只知输入输出的系统 |
| 黑箱问题 | Black Box Problem | /blæk bɑːks ˈprɑːbləm/ | 难以解释模型内部决策过程的困境 |
| BM25 | BM25 | /biː em twɛnti faɪv/ | 基于词频和逆文档频率的经典文本检索算法 |
| 造轮子 | Building from Scratch | /ˈbɪldɪŋ frʌm skrætʃ/ | 自行开发MCP Server,不依赖社区已有实现 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 缓存策略 | Cache Strategy | /kæʃ ˈstrætədʒi/ | 缓存相同或相似问题的答案,避免重复API调用 |
| 候选集 | Candidate Set | /ˈkændɪdət set/ | 采样时实际进入随机选择的词的集合 |
| 能力声明 | Capabilities Declaration | /ˌkeɪpəˈbɪlətiz ˌdekləˈreɪʃn/ | 初始化阶段Server向Client声明支持的MCP功能列表 |
| 因果 | Causality | /kɔːˈzæləti/ | 输入对输出的驱动关系,与相关性相区分 |
| 思维链 | Chain of Thought (CoT) | /tʃeɪn ɒv θɔːt/ | 让模型先逐步推理再给出最终回答的方法 |
| 链式法则 | Chain Rule | /tʃeɪn ruːl/ | 反向传播的微积分数学基础 |
| 思维链 | Chain-of-Thought (CoT) | /tʃeɪn ɒv θɔːt/ | 让模型显式输出中间推理步骤的提示技术 |
| Chroma | Chroma | /ˈkroʊmə/ | 轻量级开源向量数据库,适合学习和原型开发 |
| 逐块输出 | Chunk-by-chunk Output | /tʃʌŋk baɪ tʃʌŋk ˈaʊtpʊt/ | 流式模式下内容逐步返回的呈现方式 |
| 文档分块 | Chunking | /ˈtʃʌŋkɪŋ/ | 将长文档切成语义完整的小块以便检索的预处理技术 |
| 引文追溯 | Citation Tracking | /saɪˈteɪʃn ˈtrækɪŋ/ | 要求AI在回答中引用来源,确保答案可验证 |
| 闭源 | Closed Source | /kloʊzd sɔːrs/ | 不公开核心技术细节,仅通过API提供服务的商业模式 |
| 解析解 | Closed-form Solution | /kləʊzd fɔːm səˈluːʃən/ | 可以直接用公式算出的精确数学解 |
| 共现关系 | Co-occurrence | /koʊ əˈkɜːrəns/ | 两个词在文本中经常一起出现,是Embedding学习的核心信号 |
| 代码生成 | Code Generation | /koʊd ˌdʒenəˈreɪʃn/ | 通过自然语言描述让AI自动编写代码 |
| 代码集成 | Code Integration | /koʊd ˌɪntɪˈɡreɪʃn/ | 通过MCP SDK编程方式在应用中连接和调用MCP Server |
| 代码驱动 | Code-driven | /koʊd ˈdrɪvn/ | 用代码明确定义Agent行为逻辑的控制方式 |
| 向量集合 | Collection | /kəˈlekʃn/ | Chroma中组织和存储向量的基本单位 |
| Common Crawl | Common Crawl | /ˈkɒmən krɔːl/ | 非营利组织运营的免费互联网爬取数据集 |
| 兼容接口 | Compatible Interface | /kəmˈpætəbl ˈɪntərfeɪs/ | 其他模型厂商模仿OpenAI API风格的接口兼容策略 |
| 算力 | Compute | /kəmˈpjuːt/ | 训练所消耗的浮点运算量,通常以 FLOPs 计 |
| 算力预算 | Compute Budget | /kəmˈpjuːt ˈbʌdʒɪt/ | 单次推理允许消耗的最大 Token 或计算量 |
| 算力 | Compute Power | /kəmˈpjuːt ˈpaʊər/ | 模型训练和推理所需的计算资源,通常以FLOPs衡量 |
| 条件概率 | Conditional Probability | /kənˈdɪʃənl ˌprɒbəˈbɪləti/ | 在已知某事件发生的条件下另一事件发生的概率 |
| 宪法式AI | Constitutional AI | /ˌkɒnstɪˈtjuːʃənl eɪ aɪ/ | Anthropic提出的基于原则清单进行自我改进的对齐方法 |
| 约束条件 | Constraints | /kənˈstreɪnts/ | 告诉AI不能做什么、必须遵守什么规则 |
| 上下文 | Context | /ˈkɑːntekst/ | 模型预测下一个词时参考的已生成文本 |
| 上下文拼接 | Context Assembly | /ˈkɑːntekst əˈsembli/ | 将检索到的文档和用户问题整合成结构化Prompt的过程 |
| 上下文管理 | Context Management | /ˈkɑːntekst ˈmænɪdʒmənt/ | 控制对话历史长度和内容的策略 |
| 上下文质量 | Context Quality | /ˈkɑːntekst ˈkwɑːləti/ | 传给AI的检索结果的相关性和完整性度量 |
| 上下文结构化 | Context Structuring | /ˈkɒntekst ˈstrʌktʃərɪŋ/ | 将训练数据组织成特定格式(如问题-答案)让模型学习任务模式 |
| 上下文稀释 | Context Dilution | /ˈkɒntekst daɪˈluːʃn/ | 过多Skill的description在启动时抢占上下文,降低路由精度的现象 |
| 上下文窗口 | Context Window | /ˈkɒntekst ˈwɪndəʊ/ | 模型在预测下一个Token时能参考的最大Token数量范围 |
| 持续学习 | Continual Learning | /kənˈtɪnjuəl ˈlɜːnɪŋ/ | 模型随时间推移不断吸收新数据与新偏好的能力 |
| 收敛 | Convergence | /kənˈvɜːrdʒəns/ | 模型训练中参数接近最优解、损失不再显著下降的状态 |
| 指代消解 | Coreference Resolution | /ˈkoʊrefərəns ˌrezəˈluːʃən/ | 确定代词指向哪个实体的语言理解能力 |
| 语料库 | Corpus | /ˈkɔːrpəs/ | 用于训练或评估语言模型的大规模文本集合(复数形式:Corpora) |
| 余弦距离 | Cosine Distance | /ˈkoʊsaɪn ˈdɪstəns/ | 1 - 余弦相似度,Chroma中配置cosine后返回的距离值 |
| 余弦相似度 | Cosine Similarity | /ˈkoʊsaɪn ˌsɪməˈlærəti/ | 衡量两个向量方向相近程度的指标,值域[-1,1] |
| 思维链推理 | CoT Reasoning | /siː oʊ tiː ˈriːzənɪŋ/ | Agent在行程规划中通过分步思考得出最优方案的机制 |
| 反事实推理 | Counterfactual Reasoning | /ˌkaʊntəˈfæktʃuəl ˈriːzənɪŋ/ | "如果……会怎样"的假设性推理 |
| 创造性 | Creativity | /ˌkriːeɪˈtɪvəti/ | 模型用语、联想、结构上的多样性 |
| 创意控制 | Creativity Control | /ˌkriːeɪˈtɪvəti kənˈtroʊl/ | 通过temperature等参数调节AI输出风格 |
| 跨语言通信 | Cross-Language Communication | /krɔːs ˈlæŋɡwɪdʒ kəˌmjuːnɪˈkeɪʃn/ | Server和Client用不同语言开发,通过标准协议互操作的能力 |
| 众包标注 | Crowdsourced Annotation | /ˈkraʊdsɔːrst ˌænəˈteɪʃən/ | 通过互联网平台分发标注任务给大量自由职业者的方式 |
| 累积概率 | Cumulative Probability | /ˈkjuːmjələtɪv ˌprɒbəˈbɪləti/ | 按顺序叠加的概率和 |
| 维度灾难 | Curse of Dimensionality | /kɜːrs əv daɪˌmenʃəˈnæləti/ | 高维向量导致计算和存储开销剧增的问题 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 数据偏见 | Data Bias | /ˈdeɪtə ˈbaɪəs/ | 训练数据中存在的系统性偏差,可能导致模型输出不公平结果 |
| 数据清洗 | Data Cleaning | /ˈdeɪtə ˈkliːnɪŋ/ | 去除训练数据中的噪声、重复、低质量内容的过程 |
| 数据框架 | Data Framework | /ˈdeɪtə ˈfreɪmwɜːrk/ | 封装数据处理流程的软件框架,如LlamaIndex |
| 数据质量 | Data Quality | /ˈdeɪtə ˈkwɒləti/ | 训练数据的准确性、多样性和可用性的综合度量 |
| 数据驱动 | Data-Driven | /ˈdeɪtə ˈdrɪvən/ | 用海量数据而非数学精确解的方法论 |
| 决策与执行分离 | Decision-Execution Separation | /dɪˈsɪʒn ɪɡˈzekjuːʃn ˌsepəˈreɪʃn/ | LLM做决策、代码做执行的核心架构原则 |
| 解码策略 | Decoding Strategy | /diːˈkəʊdɪŋ ˈstrætədʒi/ | 从模型概率分布生成最终 Token 序列的方法 |
| 演绎法 | Deductive Reasoning | /dɪˈdʌktɪv ˈriːzənɪŋ/ | 从已有规则出发推导结论的方法,传统编程的语言处理方式 |
| 深度学习 | Deep Learning | /diːp ˈlɜːrnɪŋ/ | 用多层神经网络自动学习特征表示的AI方法 |
| 退化 | Degeneration | /dɪˌdʒenəˈreɪʃn/ | 文本出现重复、平淡或混乱的生成问题 |
| 示例 | Demonstration | /ˌdemənˈstreɪʃn/ | 在 Prompt 中放置的“问题-答案”样本 |
| Dense架构 | Dense Architecture | /dens ˈɑːrkɪtektʃər/ | 每次推理使用全部参数的模型架构 |
| Description 编写 | Description Authoring | /dɪˈskrɪpʃn ˈɔːθərɪŋ/ | 编写Resource描述以帮助LLM精准匹配资源的技术 |
| 目的地知识库 | Destination Knowledge Base | /ˌdestɪˈneɪʃn ˈnɒlɪdʒ beɪs/ | 包含城市信息、景点、预算区间的结构化数据集 |
| 确定性 | Determinism | /dɪˈtɜːmɪnɪzəm/ | 相同输入总是产生相同输出的性质 |
| 深度优先搜索 | DFS (Depth-First Search) | /depθ fɜːrst sɜːrtʃ/ | ToT中沿一条路径探索到底再回溯的搜索算法 |
| 对话模型 | Dialogue Model | /ˈdaɪəlɒɡ ˈmɒdl/ | 经过指令微调和对齐训练的、能进行多轮对话的语言模型 |
| 分布式表示 | Distributed Representation | /dɪˈstrɪbjuːtɪd ˌreprɪzenˈteɪʃən/ | 知识分散存储在多个参数的组合中,非单个参数独立编码 |
| 点积 | Dot Product | /dɒt ˈprɒdʌkt/ | 向量对应位置相乘再相加的运算,用于计算余弦相似度 |
| 动态生成 | Dynamic Generation | /daɪˈnæmɪk ˌdʒenəˈreɪʃn/ | 实时查询外部系统自动生成Resources列表的方式 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 边界情况 | Edge Case | /edʒ keɪs/ | 处于正常范围之外、容易触发异常行为的罕见输入 |
| 词嵌入 | Embedding | /ɪmˈbedɪŋ/ | 把词映射为高维向量的过程 |
| 词嵌入层 | Embedding Layer | /ɪmˈbedɪŋ ˈleɪər/ | 神经网络中将Token ID映射为稠密向量的参数层 |
| 嵌入表 | Embedding Table | /ɪmˈbedɪŋ ˈteɪbl/ | 存储所有Token的Embedding向量的查找表 |
| 涌现 | Emergence | /ɪˈmɜːdʒəns/ | 整体展现出局部不具备的性质,跨层级的新特性 |
| 涌现边界 | Emergence Boundary | /ɪˈmɜːdʒəns ˈbaʊndri/ | 仅靠扩大规模无法获得的能力所形成的上限 |
| 涌现能力 | Emergent Abilities | /ɪˈmɜːdʒənt əˈbɪlətiz/ | 模型规模超过某个阈值后突然出现的、小模型不具备的能力 |
| 工程化防线 | Engineering Guardrails | /ˌendʒɪˈnɪərɪŋ ˈɡɑːdreɪlz/ | 围绕FC调用流程构建的错误处理、安全检查、超时兜底等工程保护机制 |
| 信息熵 | Entropy | /ˈentrəpi/ | 衡量信息不确定性的度量单位,香农提出的核心概念 |
| 环境变量 | Environment Variable | /ɪnˈvaɪrənmənt ˈveriəbl/ | 存储API密钥的安全方式,避免硬编码在代码中 |
| 情景记忆 | Episodic Memory | /ˌepɪˈsɒdɪk ˈmeməri/ | 记录完整交互事件用于审计分析的记忆 |
| 时期 | Epoch | /ˈiːpɒk/ | 完整遍历一次整个训练数据集 |
| 评估查询 | Evaluation Queries | /ɪˌvæljuˈeɪʃn ˈkwɪəriz/ | 用于验证description路由准确性的测试查询集,包含应触发和不应触发两类用例 |
| 欧几里得距离 | Euclidean Distance | /juːˈklɪdiən ˈdɪstəns/ | 多维空间中两点之间的直线距离 |
| 精确浏览 | Exact Browsing | /ɪɡˈzækt ˈbraʊzɪŋ/ | 像翻目录一样手动选择资源的精准获取模式 |
| 可解释AI | Explainable AI (XAI) | /ɪkˈsplænəbl eɪ aɪ/ | 旨在让AI决策过程可理解的研究领域 |
| 外推 | Extrapolation | /ɪkˌstræpəˈleɪʃn/ | 从已知范围向外预测未知范围的推理 |
| 外部幻觉 | Extrinsic Hallucination | /ekˈstrɪnsɪk həˌluːsɪˈneɪʃn/ | 输出内容无法从源文本验证,需借助外部知识才能判定的幻觉类型 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 编造引用 | Fabricated Citation | /ˈfæbrɪkeɪtɪd saɪˈteɪʃn/ | 模型编造不存在的论文、案例或引用文献的典型现象 |
| 精确性 | Factuality | /ˌfæktʃuˈæləti/ | 模型输出内容与事实一致的程度 |
| 前馈网络 | Feed-Forward Network (FFN) | /fiːd ˈfɔːwərd ˈnetwɜːk/ | Transformer每层中负责深度变换的全连接子模块 |
| 少样本 | Few-Shot | /fjuː ʃɒt/ | 提供少量示例(通常 3-10 个)的情境学习形式 |
| 微调 | Fine-Tuning | /faɪn ˈtjuːnɪŋ/ | 在预训练模型基础上使用少量标注数据做针对性参数调整 |
| 结束原因 | Finish Reason | /ˈfɪnɪʃ ˈriːzn/ | 指示模型停止生成原因的状态字段 |
| 基础模型 | Foundation Model | /faʊnˈdeɪʃən ˈmɒdl/ | 经过大规模预训练的通用语言模型,可作为下游任务微调的基础 | | 四棒接力赛 | Four-Baton Relay | /fɔːr ˈbætn ˈriːleɪ/ | AI理解意图→传统提取信息→传统查询数据→LLM生成回复的协作流程 | | 框架自动化 | Framework Automation | /ˈfreɪmwɜːrk ˌɔːtəˈmeɪʃn/ | 利用框架封装好的功能简化开发流程 | | 频率惩罚 | Frequency Penalty | /ˈfriːkwənsi ˈpenəlti/ | 降低已出现词再次被采样的概率,用以减少重复 | | 函数 | Function | /ˈfʌŋkʃən/ | 输入到输出的映射关系 | | 函数调用机制 | Function Calling | /ˈfʌŋkʃn ˈkɔːlɪŋ/ | 让LLM不仅能输出文本,还能调用外部函数执行实际操作 | | 函数描述 | Function Description | /ˈfʌŋkʃn dɪˈskrɪpʃn/ | 工具定义中的description字段,LLM靠它判断是否调用该工具 | | 函数映射表 | Function Mapping Table | /ˈfʌŋkʃn ˈmæpɪŋ ˈteɪbl/ | 将LLM返回的工具名字符串映射到真实Python函数对象的字典 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 泛化 | Generalization | /ˌdʒenrəlaɪˈzeɪʃən/ | 从训练数据学习规律并应用到新数据的能力 |
| 目标导向 | Goal-oriented | /ɡoʊl ˈɔːrientɪd/ | Agent围绕目标组织行为,而非仅仅回答问题 |
| 优雅关闭 | Graceful Shutdown | /ˈɡreɪsfl ˈʃʌtdaʊn/ | Server收到关闭通知后释放资源安全退出的过程 |
| 梯度 | Gradient | /ˈɡreɪdiənt/ | 参数对Loss影响程度的数值 |
| 梯度下降 | Gradient Descent | /ˈɡreɪdiənt dɪˈsent/ | 沿Loss下降方向迭代调整参数 |
| 梯度更新 | Gradient Update | /ˈɡreɪdiənt ʌpˈdeɪt/ | 通过反向传播调整模型参数的训练步骤 |
| 贪心解码 | Greedy Decoding | /ˈɡriːdi diːˈkəʊdɪŋ/ | 每一步都选最高概率词的采样策略,等价于 T→0 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 幻觉 | Hallucination | /həˌluːsɪˈneɪʃən/ | 模型生成看似合理但实际不正确的信息的现象 |
| 固定写死 | Hardcoded Resources | /ˈhɑːrdˈkoʊdɪd rɪˈsɔːrsɪz/ | 在代码中预定义Resources,适用于资源不常变化的场景 |
| 有害内容 | Harmful Content | /ˈhɑːrmfəl ˈkɒntent/ | 模型可能生成的违法、危险或不道德的内容 |
| 无害的 | Harmless | /ˈhɑːmləs/ | 对齐三目标之一:拒绝有害请求、避免偏见 |
| 有帮助的 | Helpful | /ˈhelpfl/ | 对齐三目标之一:真正理解用户意图并提供有用建议 |
| 分层可导航小世界图 | Hierarchical Navigable Small World (HNSW) | /ˌhaɪəˈrɑːrkɪkl ˈnævɪɡəbl smɔːl wɜːrld/ | 基于多层图结构的近似搜索算法,查询极快 |
| 历史摘要 | History Summarization | /ˈhɪstəri ˌsʌməraɪˈzeɪʃn/ | 将早期对话压缩为简洁摘要的上下文管理策略 |
| HNSW 图 | HNSW Graph | /eɪtʃ en es ˈdʌbəl juː ɡræf/ | 分层小世界图,通过多层跳表结构实现对数级搜索复杂度 |
| 诚实的 | Honest | /ˈɒnɪst/ | 对齐三目标之一:承认不确定、不夸大能力 |
| 诚实 | Honesty | /ˈɒnəsti/ | 模型在不确定时承认不知道而非编造答案的能力 |
| 人类标注 | Human Annotation | /ˈhjuːmən ˌænəˈteɪʃən/ | 由人工为训练数据提供正确答案或质量评分的流程 |
| 混合架构 | Hybrid Architecture | /ˈhaɪbrɪd ˈɑːrkɪtektʃər/ | AI和传统技术接力协作的系统架构模式 |
| 混合范式 | Hybrid Paradigm | /ˈhaɪbrɪd ˈpærədaɪm/ | 代码定义流程+LLM负责推理生成的Agent实现方式 |
| 混合规划 | Hybrid Planning | /ˈhaɪbrɪd ˈplænɪŋ/ | 规则引擎+LLM分层结合,平衡效率与灵活性 |
| 多路召回 | Hybrid Search | /ˈhaɪbrɪd sɜːrtʃ/ | 同时使用多种检索方法(向量、关键词、BM25)后合并结果 |
| 参数调优 | Hyperparameter Tuning | /ˌhaipəpəˈræmɪtə(r) ˈtjuːnɪŋ/ | 对 Temperature、Top-p 等运行时参数的系统性试验与选择 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 情境学习 | In-Context Learning | /ɪn ˈkɒntekst ˈlɜːnɪŋ/ | 不更新参数、仅靠提示词示例让模型执行新任务的能力 |
| 索引构建 | Indexing | /ˈɪndeksɪŋ/ | 将文档解析、分块、向量化后构建可检索索引的过程 |
| 归纳 | Induction | /ɪnˈdʌkʃn/ | 从具体示例推断一般模式的过程 |
| 归纳法 | Inductive Learning | /ɪnˈdʌktɪv ˈlɜːnɪŋ/ | 从大量具体数据中自动总结规律的方法,现代语言模型的核心范式 |
| 推理 | Inference | /ˈɪnfərəns/ | 用训练好的模型对新输入进行计算并输出结果 |
| 拐点 | Inflection Point | /ɪnˈflekʃn pɔɪnt/ | 曲线凹凸性转变之处,能力跃迁常在此发生 |
| 信息整合 | Information Synthesis | /ˌɪnfərˈmeɪʃn ˈsɪnθəsɪs/ | LLM将Server返回的多步数据整合为连贯自然语言的能力 |
| 初始化握手 | Initialization Handshake | /ɪˌnɪʃəlaɪˈzeɪʃn ˈhændʃeɪk/ | Client和Server交换协议版本和能力声明的连接建立阶段 |
| 参数校验 | Input Validation | /ˈɪnpʊt ˌvælɪˈdeɪʃn/ | 对Tool参数进行类型、范围和格式的合法性检查 |
| InstructGPT | InstructGPT | /ɪnˈstrʌkt dʒiː piː tiː/ | ChatGPT的前身,首次展示SFT+RLHF技术路线的模型 |
| 指令遵循 | Instruction Following | /ɪnˈstrʌkʃən ˈfɒləʊɪŋ/ | 模型理解和执行人类指令的能力 |
| 智能编排 | Intelligent Orchestration | /ɪnˈtelɪdʒənt ˌɔːrkɪˈstreɪʃn/ | LLM智能决策+AI应用调度编排的协作模式 |
| 交互流程设计 | Interaction Flow Design | /ˌɪntərˈækʃn floʊ dɪˈzaɪn/ | 设计用户、AI应用和MCP Server之间的多步交互流程 |
| 交错规划 | Interleaved Planning | /ˌɪntərˈliːvd ˈplænɪŋ/ | 每执行一步后根据结果重新规划的ReAct策略 |
| 可解释性 | Interpretability | /ɪnˌtɜːprətəˈbɪləti/ | 让模型的决策理由对人类可理解、可审查 |
| 内在幻觉 | Intrinsic Hallucination | /ɪnˈtrɪnsɪk həˌluːsɪˈneɪʃn/ | 输出内容与所给源文本直接矛盾的幻觉类型 |
| 倒排文件索引 | Inverted File Index (IVF) | /ɪnˈvɜːrtɪd faɪl ˈɪndeks/ | 通过聚类将向量空间分区,只搜索最近簇的索引方法 |
| 迭代 | Iteration | /ˌɪtəˈreɪʃən/ | 一次前向+反向+参数更新的全过程 |
| 行程规划 | Itinerary Planning | /aɪˈtɪnərəri ˈplænɪŋ/ | Agent将天数、预算和景点信息综合为每日行程的过程 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 越狱 | Jailbreak | /ˈdʒeɪlbreɪk/ | 通过提示技巧绕过AI安全限制的行为 |
| 联合概率 | Joint Probability | /dʒɔɪnt ˌprɒbəˈbɪləti/ | 多个事件同时发生的概率,记为P(词1,词2,...,词n) |
| JSON模式 | JSON Mode | /ˈdʒeɪsɑːn moʊd/ | 通过response_format参数强制AI输出纯JSON |
| JSON模式 | JSON Schema | /ˈdʒeɪsɒn ˈskiːmə/ | 定义工具参数结构的规范,包括类型、必填、枚举等约束 |
| JSON-RPC 2.0 | JSON-RPC 2.0 | /ˈdʒeɪsɑːn ɑːr piː siː tuː pɔɪnt oʊ/ | 基于JSON的轻量级远程过程调用协议,MCP的基础通信协议 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 精确近邻 | K-Nearest Neighbor (KNN) | /keɪ ˈnɪərəst ˈneɪbər/ | 遍历全部数据确保返回最精确的Top-K结果 |
| KL散度 | KL Divergence | /ˌkeɪ el daɪˈvɜːdʒəns/ | 衡量两个概率分布差异的指标,用于约束模型漂移 |
| 知识库 | Knowledge Base | /ˈnɑːlɪdʒ beɪs/ | 存储结构化/非结构化文档的系统,RAG检索的数据来源 |
| 过时知识 | Knowledge Cutoff | /ˈnɒlɪdʒ ˈkʌtɒf/ | 预训练模型知识的截止时间点,之后的信息模型无法知晓 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 语言无关性 | Language Agnosticism | /ˈlæŋɡwɪdʒ ˌæɡnɑːˈstɪsɪzəm/ | MCP协议不限制实现语言,任何能处理JSON的语言都可使用 |
| 语言模型 | Language Model | /ˈlæŋɡwɪdʒ ˈmɒdl/ | 对语言序列概率分布进行建模的数学模型 |
| 语言服务器协议 | Language Server Protocol (LSP) | /ˈlæŋɡwɪdʒ ˈsɜːrvər ˈproʊtəkɑːl/ | 标准化编辑器与语言服务之间通信的协议,MCP的灵感来源 |
| 大语言模型 | Large Language Model (LLM) | /lɑːdʒ ˈlæŋɡwɪdʒ ˈmɒdl/ | 参数量通常在数十亿到数千亿级别的语言模型 |
| 学习率 | Learning Rate | /ˈlɜːnɪŋ reɪt/ | 控制参数调整幅度的超参数 |
| 学习率衰减 | Learning Rate Decay | /ˈlɜːnɪŋ reɪt dɪˈkeɪ/ | 训练初期大步、后期精细调整 |
| 线性 | Linear | /ˈlɪniər/ | 输入输出成正比,可加可乘的简单关系 |
| LLM主导型应用 | LLM-Centric Application | /ˈlːm ˈsentrɪk ˌæplɪˈkeɪʃn/ | LLM是产品灵魂,去掉LLM后产品不存在的应用形态 |
| 局部敏感哈希 | Locality-Sensitive Hashing (LSH) | /loʊˈkæləti ˈsensətɪv ˈhæʃɪŋ/ | 将相似向量映射到同一哈希桶的近似搜索算法 |
| 激活值 | Logit | /ˈlɒdʒɪt/ | Softmax 归一化之前的原始分数 |
| 长短期记忆网络 | Long Short-Term Memory (LSTM) | /lɒŋ ʃɔːt tɜːm ˈmeməri/ | 引入门控机制缓解信息衰减的改进型RNN |
| 长期记忆 | Long-term Memory | /lɒŋ tɜːm ˈmeməri/ | 跨会话、跨年度保持信息一致的能力 |
| 损失 | Loss | /lɒs/ | 预测值与正确答案的差距 |
| 低资源语言 | Low-resource Language | /ləʊ rɪˈsɔːrs ˈlæŋɡwɪdʒ/ | 训练语料稀少的小语种,如孟加拉语 |
| 最近最少使用缓存 | lru_cache | /lruː kæʃ/ | Python内置缓存装饰器,自动记录函数调用结果,对不变数据节省重复查询成本 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 机器学习 | Machine Learning | /məˈʃiːn ˈlɜːrnɪŋ/ | 让机器从数据中自动学习规律,而非手工编写规则 |
| 可维护性 | Maintainability | /meɪnˌteɪnəˈbɪləti/ | 代码易于修改、扩展和排错的特性 |
| 手写实现 | Manual Implementation | /ˈmænjuəl ɪmplɪmenˈteɪʃn/ | 不依赖框架,从零编写所有RAG流程代码的方式 |
| Markdown语法 | Markdown Syntax | /ˈmɑːrkdaʊn ˈsɪntæks/ | 用于组织复杂Prompt的轻量级标记语言 |
| 最大令牌数 | Max Tokens | /mæks ˈtoʊkənz/ | 限制模型生成内容的最大Token数量 |
| 蒙特卡洛树搜索 | MCTS (Monte Carlo Tree Search) | /em siː tiː es/ | 结合随机采样和价值评估的树搜索算法 |
| 元数据 | Metadata | /ˈmetədeɪtə/ | 描述数据的数据,如文档来源、类型、标签、时间等 |
| 方法命名空间 | Method Namespace | /ˈmeθəd ˈneɪmspeɪs/ | 用点号分层的命名方式如resources/list、tools/call |
| 幻象 | Mirage | /ˈmɪrɑːʒ/ | 涌现“假象”的典型比喻,对应 Schaeffer 2023 论文 |
| MoE | Mixture of Experts | /ˈmɪkstʃər əv ˈekspɜːrts/ | 混合专家模型,每次推理只激活部分参数的架构 |
| 模型上下文协议 | Model Context Protocol (MCP) | /ˈmɑːdl ˈkɑːntekst ˈproʊtəkɑːl/ | 统一AI应用与外部工具交互的标准化协议 |
| 模型选择 | Model Selection | /ˈmɑːdl sɪˈlekʃn/ | 根据任务复杂度选择不同能力级别的模型 |
| 模块化智能体 | Modular Agent | /ˈmɒdjʊlər ˈeɪdʒənt/ | 将Agent拆分为多个专业模块各司其职的架构 |
| 单体智能体 | Monolithic Agent | /ˌmɒnəˈlɪθɪk ˈeɪdʒənt/ | 用一个LLM承担所有角色,没有功能分工的架构 |
| 多轮对话 | Multi-turn Dialogue | /ˈmʌlti tɜːrn ˈdaɪəlɑːɡ/ | 用户与AI之间连续多轮交互的对话形式 |
| 多轮工具调用 | Multi-turn Tool Calling | /ˈmʌlti tɜːn tuːl ˈkɔːlɪŋ/ | 依赖上一步结果逐步执行多次工具调用的流程模式 |
| 多模态 | Multimodal | /ˌmʌltiˈməʊdl/ | 同时处理文本、图像、音频等多种模态的能力 |
| 多模态生成 | Multimodal Generation | /ˌmʌltiˈmoʊdl ˌdʒenəˈreɪʃn/ | AI生成图像、视频、音频等多类型内容 |
| 多模态感知 | Multimodal Perception | /ˌmʌltiˈmoʊdl pərˈsepʃn/ | Agent处理图像、语音等非文本输入的能力 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| N元模型 | N-gram Model | /ˈen græm ˈmɒdl/ | 基于前n-1个词预测第n个词的统计模型,上下文窗口固定 |
| 名称标准化映射 | Name Normalization Mapping | /neɪm ˌnɔːməlaɪˈzeɪʃn ˈmæpɪŋ/ | 在函数内部处理LLM传入的变体名称,统一转换为标准值的容错策略 |
| 自然语言生成 | Natural Language Generation (NLG) | /ˈnætʃrəl ˈlæŋɡwɪdʒ ˌdʒenəˈreɪʃn/ | LLM根据输入生成符合语境文本或代码的能力 |
| 自然语言理解 | Natural Language Understanding (NLU) | /ˈnætʃrəl ˈlæŋɡwɪdʒ ˌʌndərˈstændɪŋ/ | LLM将模糊自然语言转换为结构化信息的能力 |
| 下一Token预测 | Next-Token Prediction | /nekst ˈtoʊkən prɪˈdɪkʃən/ | 语言模型根据已有Token序列预测下一个Token的核心训练任务和目标 |
| 非线性 | Non-linearity | /ˌnɒn lɪnɪˈærəti/ | 输入与输出不成比例变化的关系,是涌现的数学特征 |
| 非线性 | Nonlinear | /nɒnˈlɪniər/ | 输入输出有转折和拐弯的复杂关系 |
| 非线性系统 | Nonlinear System | /nɒnˈlɪniər ˈsɪstəm/ | 输出与输入不成正比的复杂系统 |
| 归一化 | Normalization | /ˌnɔːrməlɪˈzeɪʃn/ | 将向量长度缩放为1,使点积等于余弦相似度 |
| npm 发布 | npm Publishing | /en piː em ˈpʌblɪʃɪŋ/ | 将TypeScript开发的MCP Server以npm包形式发布共享 |
| 核采样 | Nucleus Sampling | /ˈnjuːkliəs ˈsɑːmplɪŋ/ | 从累计概率达到 p 的动态“核”中采样的解码策略(Top-p) |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 观察 | Observation | /ˌɒbzərˈveɪʃn/ | ReAct循环中查看工具返回结果的过程 |
| 按需加载 | On-Demand Loading | /ɑːn dɪˈmænd ˈloʊdɪŋ/ | LLM先浏览Resource描述,确认需要时才读取完整内容的机制 |
| 一键安装 | One-Click Install | /wʌn klɪk ɪnˈstɔːl/ | 通过MCP广场图形界面一键配置并使用MCP Server |
| 独热编码 | One-Hot Encoding | /wʌn hɒt ɪnˈkəʊdɪŋ/ | 每个词用一个只有一位为1其余为0的向量表示的编码方式 |
| 单样本 | One-Shot | /wʌn ʃɒt/ | 只提供一个示例的情境学习形式 |
| 单向通知 | One-Way Notification | /wʌn weɪ ˌnoʊtɪfɪˈkeɪʃn/ | 不带id的消息,发送方不期待响应的单方向通信 |
| 开源 | Open Source | /ˈoʊpən sɔːrs/ | 公开源代码和模型权重供社区使用、研究、修改的方式 |
| 输出格式 | Output Format | /ˈaʊtpʊt ˈfɔːrmæt/ | 规定AI回复的结构和样式要求 |
| 过拟合 | Overfitting | /ˌoʊvərˈfɪtɪŋ/ | 模型过度记忆训练数据细节而丧失泛化能力 |
| 重叠 | Overlap | /ˌoʊvərˈlæp/ | 相邻Chunk之间共享的内容比例,通常为10%-20% |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 包管理器 | Package Manager | /ˈpækɪdʒ ˈmænɪdʒər/ | 管理MCP Server依赖和分发的工具,如npm、PyPI |
| 并行调用 | Parallel Tool Calling | /ˈpærəlel tuːl ˈkɔːlɪŋ/ | LLM在单次API调用中返回多个相互独立的工具调用指令 |
| 参数 | Parameter | /pəˈræmɪtər/ | 模型可学习的权重和偏置 |
| 参数量 | Parameter Count | /pəˈræmɪtə(r) kaʊnt/ | 模型中可学习权重的总数,衡量模型规模 |
| 参数提取 | Parameter Extraction | /pəˈræmɪtər ɪkˈstrækʃn/ | LLM从用户输入中识别并提取函数参数的子任务 |
| 参数精调 | Parameter Fine-Tuning | /pəˈræmɪtər faɪn ˈtjuːnɪŋ/ | 在已有参数基础上做微小调整而非重新训练 |
| 参数冻结 | Parameter Freezing | /pəˈræmɪtər ˈfriːzɪŋ/ | 训练完成后固定参数不再更新的过程 |
| 参数引导 | Parameter Guidance | /pəˈræmɪtər ˈɡaɪdns/ | Prompt在参数缺失时主动询问用户补充的交互机制 |
| 模式识别 | Pattern Recognition | /ˈpætərn ˌrekəɡˈnɪʃən/ | 从数据中发现重复出现结构的能力,语言模型通过统计模式识别语言规律 |
| PDF 文本提取 | PDF Text Extraction | /piː diː ef tekst ɪkˈstrækʃn/ | 从PDF文件中提取纯文本内容的技术 |
| 感知速度 | Perceived Speed | /pərˈsiːvd spiːd/ | 用户感受上的响应速度,不等于实际生成速度 |
| 感知 | Perception | /pəˈsepʃn/ | Agent从环境中获取信息的过程 |
| 感知层 | Perception Layer | /pərˈsepʃn ˈleɪər/ | 将外部输入转化为LLM可理解形式的模块 |
| 持续性 | Persistence | /pərˈsɪstəns/ | Agent保持跨轮次记忆和内部状态的能力 |
| 相变 | Phase Transition | /feɪz trænˈzɪʃn/ | 物理学术语,比喻涌现的非线性跃迁特征 |
| 管道化处理 | Pipeline Processing | /ˈpaɪplaɪn ˈprɑːsesɪŋ/ | 将数据处理流程组织为有序的阶段式处理链 |
| 占位符 | Placeholder | /ˈpleɪshoʊldər/ | Prompt模板中预留的变量位置{{}},用户传入具体参数 |
| 先规划后执行 | Plan-then-Execute | /plæn ðen ˈeksɪkjuːt/ | 先生成完整计划再逐步执行的规划策略 |
| 规划 | Planning | /ˈplænɪŋ/ | 针对长期目标制定多步骤行动序列的能力 |
| 规划层 | Planning Layer | /ˈplænɪŋ ˈleɪər/ | 将高层目标拆解为可执行子任务序列的模块 |
| 轮询刷新 | Polling Refresh | /ˈpoʊlɪŋ riːˈfreʃ/ | 定时扫描外部系统以更新Resources列表的机制 |
| 一词多义 | Polysemy | /pəˈlɪsəmi/ | 同一词语在不同语境中含义不同 |
| 正例与反例 | Positive & Negative Examples | /ˈpɑːzətɪv ənd ˈneɡətɪv ɪɡˈzæmplz/ | 技术规范中展示正确做法和错误做法的对照示例 |
| 幂律 | Power Law | /ˈpaʊə(r) lɔː/ | 两个变量间成幂指数关系的函数形式 |
| 语用学 | Pragmatics | /præɡˈmætɪks/ | 研究语境如何影响语言的理解和使用 |
| 预训练 | Pre-training | /priː ˈtreɪnɪŋ/ | 在海量无标注文本上训练语言模型学习通用语言能力的过程 |
| 预制模板 | Predefined Template | /ˌpriːdɪˈfaɪnd ˈtemplət/ | 将常见操作流程标准化的预设Prompt模式 |
| 偏好 | Preference | /ˈprefrəns/ | 两个候选中"哪个更好"的相对判断 |
| 偏好数据 | Preference Data | /ˈprefrəns ˈdeɪtə/ | 由人类对候选答案排序得到的训练素材 |
| 概率性编程 | Probabilistic Programming | /ˌprɑːbəbɪˈlɪstɪk ˈproʊɡræmɪŋ/ | 接受AI输出的不确定性,通过引导而非控制的开发范式 |
| 概率分布 | Probability Distribution | /ˌprɒbəˈbɪləti ˌdɪstrɪˈbjuːʃən/ | 描述随机变量所有可能取值及其概率的函数,语言模型的核心输出对象 |
| 指称问题 | Problem of Reference | /ˈprɒbləm əv ˈrefrəns/ | 符号与它所代表的事物之间关系的哲学问题 |
| 进程隔离 | Process Isolation | /ˈprɑːses ˌaɪsəˈleɪʃn/ | MCP Server运行在独立进程中,与AI应用互不影响的隔离机制 |
| 专业翻译器 | Professional Translator | /prəˈfeʃənl trænsˈleɪtər/ | 整合多参数控制实现风格可调的专业翻译工具 |
| 渐进式决策 | Progressive Decision | /prəˈɡresɪv dɪˈsɪʒn/ | LLM在调用过程中持续观察结果,动态决定后续步骤 |
| 渐进式决策 | Progressive Decision-Making | /prəˈɡresɪv dɪˈsɪʒn ˈmeɪkɪŋ/ | LLM逐步获取信息并据此决策下一步,而非一次性全部规划的模式 |
| 渐进式暴露 | Progressive Disclosure | /prəˈɡresɪv dɪˈskləʊʒə(r)/ | UX 原则,根据用户水平逐层开放参数控制 |
| 提示词 | Prompt | /prɒmpt/ | 输入给模型的文字指令与上下文 |
| 提示词工程 | Prompt Engineering | /prɑːmpt ˌendʒɪˈnɪrɪŋ/ | 设计和优化提示词以控制AI输出的技术 |
| 提示词模板 | Prompt Template | /prɑːmpt ˈtemplət/ | 可复用的提示词结构框架 |
| 提示词驱动 | Prompt-driven | /prɒmpt ˈdrɪvn/ | 通过Prompt让LLM自主完成决策的控制方式 |
| 感知-思考-行动 | PTA (Perceive-Think-Act) | /pɜːrˈsiːv θɪŋk ækt/ | Agent运行的核心循环框架 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 问答对 | Q&A Pair | /kjuː ænd eɪ peər/ | 由问题与高质量答案组成的训练数据单元 |
| 问答对数据 | QA Dataset | /kjuː eɪ ˈdeɪtəsɛt/ | 训练微调使用的问答格式标注数据集合 |
| 问题重写 | Query Rewriting | /ˈkwɪri riːˈraɪtɪŋ/ | 用LLM将用户问题改写得更清晰以提升检索准确率 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 随机初始化 | Random Initialization | /ˈrændəm ɪˌnɪʃəlaɪˈzeɪʃən/ | 参数在训练前设为随机小数 |
| 随机采样 | Random Sampling | /ˈrændəm ˈsæmplɪŋ/ | 按照概率分布随机选择下一个Token而不是每次都选最高概率者 |
| 随机种子 | Random Seed | /ˈrændəm siːd/ | 控制采样跟均分布来源的整数,保证调试时的一致输出 |
| 随机性 | Randomness | /ˈrændəmnəs/ | 采样过程中不可预测的成分,是创造力与多样性的源头 |
| 排序 | Ranking | /ˈræŋkɪŋ/ | 对多个答案按偏好从高到低排列,取代绝对打分 |
| 推理与行动 | ReAct | /ˈriːækt/ | Reasoning and Acting,思考→行动→观察交替循环的模式 |
| 只读操作 | Read-only Operation | /riːd ˈəʊnli ˌɒpəˈreɪʃn/ | 不改变系统状态的数据查询类操作,可放心交给AI |
| 读写分离 | Read-Write Separation | /riːd raɪt ˌsepəˈreɪʃn/ | Resources只读与Tools可执行的职责划分设计 |
| 真实世界交互 | Real-world Interaction | /ˈrɪəl wɜːld ˌɪntərˈækʃn/ | 与物理世界或动态环境进行行动与反馈的过程 |
| 推理 | Reasoning | /ˈriːzənɪŋ/ | 基于前提推导结论的思维过程 |
| 推理层 | Reasoning Layer | /ˈriːzənɪŋ ˈleɪər/ | 每一步决策中分析当前状态选择最优行动的模块 |
| 召回 | Recall | /rɪˈkɔːl/ | 从大量数据中找出相关内容的过程 |
| 循环神经网络 | Recurrent Neural Network (RNN) | /rɪˈkɜːrənt ˈnjʊərəl ˈnetwɜːk/ | 通过链式结构按顺序处理序列的网络,越长越容易遗忘 |
| 递归分块 | Recursive Chunking | /rɪˈkɜːrsɪv ˈtʃʌŋkɪŋ/ | 先大块再细分,尝试在语义边界处切分 |
| 递归函数 | Recursive Function | /rɪˈkɜːrsɪv ˈfʌŋkʃn/ | 在自身定义中调用自身的函数,如斐波那契数列 |
| 强化学习 | Reinforcement Learning | /ˌriːɪnˈfɔːsmənt ˈlɜːnɪŋ/ | 通过奖励信号而非标准答案来指导模型改进 |
| 人类反馈强化学习 | Reinforcement Learning from Human Feedback (RLHF) | /ˌriːɪnˈfɔːrsmənt ˈlɜːnɪŋ frəm ˈhjuːmən ˈfiːdbæk/ | 通过人类偏好评分训练奖励模型,再用强化学习优化模型输出使其符合人类期望 |
| 归一化 | Renormalize | /ˌriːˈnɔːməlaɪz/ | 对筛选后的候选词概率重新调整使其和为 1 |
| 可复现性 | Reproducibility | /ˌriːprəˌdjuːsəˈbɪləti/ | 相同输入与参数下能得到相同输出的性质 |
| 请求-响应模式 | Request-Response Pattern | /rɪˈkwest rɪˈspɑːns ˈpætərn/ | Client发送带id的请求,Server返回同id响应的通信模式 |
| 重排序 | Rerank | /riːˈræŋk/ | 对初步检索结果重新打分排序,提升最相关内容的位置 |
| 重排序模型 | Reranking Model | /riːˈræŋkɪŋ ˈmɑːdl/ | 对初筛结果进行更精确的相关性打分和重排 |
| 资源调用计数 | Resource Call Count | /ˈriːsɔːrs kɔːl kaʊnt/ | 完成一个用户需求所需的MCP调用次数统计 |
| 资源标识符 | Resource URI | /ˈriːsɔːrs juːɑːrˈaɪ/ | 唯一标识MCP中某个资源的自定义URI地址 |
| 响应格式 | Response Format | /rɪˈspɑːns ˈfɔːrmæt/ | API参数,指定AI返回内容的格式要求 |
| 响应合成器 | Response Synthesizer | /rɪˈspɑːns sɪnθəsaɪzər/ | 将检索结果组装为Prompt并调用LLM生成答案的组件 |
| 检索增强生成 | Retrieval-Augmented Generation (RAG) | /rɪˈtriːvəl ˈɔːɡmentɪd ˌdʒenəˈreɪʃən/ | 引入外部知识库辅助生成的技术 |
| 检索器 | Retriever | /rɪˈtriːvər/ | 负责从索引中查询相关文档的组件 |
| 用轮子 | Reusing Existing Tools | /riːˈjuːzɪŋ ɪɡˈzɪstɪŋ tuːlz/ | 直接使用社区已经发布的MCP Server快速扩展功能 |
| 奖励黑客 | Reward Hacking | /rɪˈwɔːd ˈhækɪŋ/ | 模型钻奖励函数漏洞刷高分而非真正改善质量 |
| 奖励模型 | Reward Model | /rɪˈwɔːd ˈmɒdl/ | 把人类排序偏好转化为可微分分数的神经网络 |
| 角色 | Role | /roʊl/ | 告诉AI以什么身份回答问题,激活相关知识和能力 |
| 路由决策 | Routing Decision | /ˈruːtɪŋ dɪˈsɪʒn/ | 大模型根据description和当前任务判断是否加载某个Skill的过程 |
| 规则前置 | Rule Pre-positioning | /ruːl ˌpriːpəˈzɪʃənɪŋ/ | 将不变规则固定在system角色中避免重复 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 采样 | Sampling | /ˈsæmplɪŋ/ | 根据概率分布从候选词中选择一个词的过程 |
| 缩放点积注意力 | Scaled Dot-Product Attention | /skeɪld dɒt ˈprɒdʌkt əˈtenʃən/ | Transformer中计算注意力权重的方式,通过Query和Key的兼容性决定Value的加权权重 |
| 规模定律 | Scaling Laws | /ˈskeɪlɪŋ lɔːz/ | 描述模型性能随参数、数据、计算量增长而提升的经验规律 |
| 分场景加载 | Scenario-based Tool Loading | /sɪˈnɑːriəʊ beɪst tuːl ˈləʊdɪŋ/ | 根据用户输入关键词预判业务场景、只加载该场景相关工具的性能优化策略 |
| SDK 成熟度 | SDK Maturity | /es diː keɪ məˈtʃʊrəti/ | 官方SDK对特定语言的开发工具和类型支持的完善程度 |
| 安全分级 | Security Classification | /sɪˈkjʊərəti ˌklæsɪfɪˈkeɪʃn/ | 按操作风险程度将FC能力分为安全区/谨慎区/危险区 |
| 安全闸门 | Security Gate | /sɪˈkjʊrəti ɡeɪt/ | AI应用在编排过程中插入的权限校验和安全拦截机制 |
| 自注意力 | Self-Attention | /ˌself əˈtenʃn/ | 让序列中每个词与其他词计算相关性权重 |
| 自我纠错 | Self-correction | /ˌself kəˈrekʃn/ | 模型在后续步骤中修正前面错误的能力 |
| 自建模型 | Self-Hosted Model | /self ˈhoʊstɪd ˈmɑːdl/ | 下载开源模型部署到自有服务器,数据不出本地 |
| 自我反思 | Self-Reflection | /self rɪˈflekʃn/ | Agent在关键节点自行检查并修正决策的机制 |
| 自监督学习 | Self-Supervised Learning | /self ˈsuːpərvaɪzd ˈlɜːnɪŋ/ | 从数据本身自动生成标签(如下一个Token预测)的训练方式 |
| 语义代数 | Semantic Algebra | /sɪˈmæntɪk ˈældʒɪbrə/ | 词向量可做加减运算的性质,如国王-男人+女人≈女王 |
| 语义分块 | Semantic Chunking | /sɪˈmæntɪk ˈtʃʌŋkɪŋ/ | 用AI判断自然段落边界进行切分 |
| 语义编码 | Semantic Encoding | /sɪˈmæntɪk ɪnˈkəʊdɪŋ/ | 将词的定义关系编码为向量空间中的位置和方向 |
| 语义模糊搜索 | Semantic Fuzzy Search | /sɪˈmæntɪk ˈfʌzi sɜːrtʃ/ | RAG中通过向量化自动匹配语义相似内容的方式 |
| 语义相关度 | Semantic Relevance | /sɪˈmæntɪk ˈreləvəns/ | 检索结果与用户查询之间的语义匹配程度 |
| 语义搜索 | Semantic Search | /sɪˈmæntɪk sɜːrtʃ/ | 基于向量空间距离衡量文本语义相似度的搜索方式 |
| 语义空间 | Semantic Space | /sɪˈmæntɪk speɪs/ | 词向量分布的高维空间,语义相近的词在空间中距离近 |
| 句子窗口检索 | Sentence Window Retrieval | /ˈsentəns ˈwɪndoʊ rɪˈtriːvl/ | 用小窗口检索 + 大窗口生成的精匹配检索策略 |
| 服务编排 | Service Orchestration | /ˈsɜːrvɪs ˌɔːrkɪˈstreɪʃn/ | AI应用在LLM和MCP Server之间协调消息传递的过程 |
| 香农游戏 | Shannon Game | /ˈʃænən ɡeɪm/ | 香农在1948年提出的根据前文预测下一个字母的思想实验,语言模型概念的雏形 |
| 短期记忆 | Short-term Memory | /ʃɔːrt tɜːrm ˈmeməri/ | 维持当前对话上下文连贯性的临时记忆 |
| 副作用操作 | Side Effect Operation | /saɪd ɪˈfekt ˌɑːpəˈreɪʃn/ | 有状态变更或外部影响的写操作,需额外安全控制 |
| 单一职责原则 | Single Responsibility Principle | /ˈsɪŋɡl rɪˌspɒnsəˈbɪləti ˈprɪnsəpl/ | 每个工具只做一件事、做好一件事的工具设计原则 |
| 技能分类 | Skill Taxonomy | /skɪl tækˈsɒnəmi/ | 将Skill按职责分为知识型、执行型、验证型和自动化型的分类体系 |
| 滑坡 | Snowball Effect | /ˈsnəʊbɔːl ɪˈfekt/ | 自回归生成中一个编造引发后续更多编造的累积现象 |
| 归一化指数函数 | Softmax | /ˈsɒftmæks/ | 将任意实数向量转换为概率分布 |
| 分裂信号 | Split Signal | /splɪt ˈsɪɡnəl/ | 提示SKILL.md需要拆分的标志,如条件分支、大量示例代码或背景知识 |
| 服务器推送事件 | SSE (Server-Sent Events) | /ˈsɜːrvər sent ɪˈvents/ | HTTP长连接下Server主动推送数据的远程传输技术 |
| 标准化协议 | Standardized Protocol | /ˈstændərdaɪzd ˈproʊtəkɑːl/ | 定义统一规范使不同组件可互操作的协议标准 |
| 标准化场景 | Standardized Scenario | /ˈstændərdaɪzd sɪˈnærioʊ/ | 用模板统一常见需求的处理方式和输出格式 |
| 统计学习 | Statistical Learning | /stəˈtɪstɪkl ˈlɜːnɪŋ/ | 从数据中发现统计模式并将其编码到模型参数中的学习方法 |
| 标准输入输出 | stdio (Standard I/O) | /ˈstændərd aɪ oʊ/ | 通过进程stdin/stdout传输JSON-RPC消息的本地传输方式 |
| Stdio传输 | Stdio Transport | /ˈstændərd aɪ oʊ ˈtrænspɔːrt/ | 通过子进程标准输入输出建立MCP通信的传输方式 |
| 逐步骤决策 | Step-by-Step Decision | /step baɪ step dɪˈsɪʒn/ | LLM每步基于上一步结果动态决策下一步的机制 |
| 分步推理 | Step-by-step Reasoning | /step baɪ step ˈriːzənɪŋ/ | 把复杂问题拆为可逐步推导的小问题 |
| 流式选项 | Stream Options | /striːm ˈɑːpʃənz/ | 流式输出中额外配置项(如include_usage) |
| 流式输出 | Streaming Output | /ˈstriːmɪŋ ˈaʊtpʊt/ | AI边生成边返回结果,提升用户体验的技术 |
| 结构化分块 | Structural Chunking | /ˈstrʌktʃərəl ˈtʃʌŋkɪŋ/ | 按标题、条款编号等文档结构元素切分 |
| 结构主义 | Structuralism | /ˈstrʌktʃərəlɪzəm/ | 认为事物的意义来自其与其他事物的关系而非本身的哲学观点 |
| 结构化输出 | Structured Output | /ˈstrʌktʃərd ˈaʊtpʊt/ | 让AI按特定数据结构(如JSON)返回结果 |
| 结构化解析 | Structured Parsing | /ˈstrʌktʃərd ˈpɑːrsɪŋ/ | 识别并保留文档层级结构(标题、条目、标签) |
| 子词 | Subword | /ˈsʌbwɜːd/ | 比完整词更小的文本单元,通过组合子词Token可用固定词表表示无限词汇 |
| 监督微调 | Supervised Fine-Tuning (SFT) | /ˌsuːpərvaɪzd faɪn ˈtjuːnɪŋ/ | 使用人工标注的指令-回答数据训练模型理解和遵循人类指令 |
| 监督学习 | Supervised Learning | /ˌsuːpərvaɪzd ˈlɜːnɪŋ/ | 使用人工标注的数据训练模型做特定任务的方法 |
| 过度迎合 | Sycophancy | /sɪˈkɒfənsi/ | 模型倾向于说让用户舒服的话而非正确的话 |
| 三段论 | Syllogism | /ˈsɪlədʒɪzəm/ | 由大前提、小前提和结论组成的逻辑推理形式 |
| 应用集成 | System Integration | /ˈsɪstəm ˌɪntɪˈɡreɪʃn/ | 将大模型接入应用程序系统的开发过程 |
| 系统提示词 | System Prompt | /ˈsɪstəm prɒmpt/ | 定义Agent角色和行为的顶层指令文本 |
| 系统角色 | System Role | /ˈsɪstəm roʊl/ | 设定AI人设与行为规则的messages角色 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 任务意识 | Task Awareness | /tæsk əˈweərnəs/ | 模型理解和区分不同任务类型(问答、翻译、续写等)的能力 |
| 任务描述 | Task Description | /tæsk dɪˈskrɪpʃn/ | 明确告诉AI需要执行的具体操作 |
| 技术选型 | Technology Stack Selection | /tekˈnɑːlədʒi stæk sɪˈlekʃn/ | 根据场景选择合适的Server和Client开发语言的技术决策 |
| 温度参数 | Temperature | /ˈtemprətʃər/ | 控制采样随机性的超参数,温度越高输出越多样、越具创造性 |
| 模板参数填充 | Template Parameter Binding | /ˈtemplət pəˈræmɪtər ˈbaɪndɪŋ/ | 用户传入参数替换模板中占位符的过程 |
| 文本清洗 | Text Cleaning | /tekst ˈkliːnɪŋ/ | 去除页眉页脚页码等干扰信息,保留纯内容 |
| 思考 | Thought | /θɔːt/ | ReAct循环中LLM分析当前状态并决定下一步的步骤 |
| 三层检查 | Three-Layer Check | /θriː ˈleɪər tʃek/ | 语法拦截→身份校验→业务执行的Tool安全检查架构 |
| 三方架构 | Three-Party Architecture | /θriː ˈpɑːrti ˈɑːrkɪtektʃər/ | LLM + AI应用 + MCP Server 各司其职的分工架构 |
| 阈值 | Threshold | /ˈθreʃhəʊld/ | 触发质变的临界点,规模跨过后能力跃迁 |
| 阈值效应 | Threshold Effect | /ˈθreʃhəʊld ɪˈfekt/ | 性能收益只在规模跨过某一点后才出现的非线性现象 |
| 词元 | Token | /ˈtoʊkən/ | 模型预测的最小文本单位,可以是词、词的一部分或标点 |
| Token 预算 | Token Budget | /ˈtoʊkən ˈbʌdʒɪt/ | 每次对话允许消耗的最大Token数量 |
| 分词 | Tokenization | /ˌtoʊkənaɪˈzeɪʃən/ | 将原始文本切分为Token序列的过程 |
| Tokens | Tokens | /ˈtoʊkənz/ | 大模型处理文本的基本单位,中文约1字=1Token |
| 工具调用 | Tool Call | /tuːl kɔːl/ | LLM以结构化JSON形式返回的、指示代码执行特定函数的指令 |
| 工具孤岛 | Tool Isolation | /tuːl ˌaɪsəˈleɪʃn/ | 工具与应用高度耦合,无法在多个AI应用间共享的问题 |
| 工具调用字段 | tool_calls | /tuːl kɔːlz/ | LLM返回的结构化字段,指示代码需要执行哪些工具函数 |
| Top-K 检索 | Top-K Retrieval | /tɑːp keɪ rɪˈtriːvl/ | 返回相似度最高的前K个检索结果 |
| 核采样 | Top-p (Nucleus Sampling) | /tɑp piː ˈnuːkliəs ˈsæmplɪŋ/ | 动态选择累积概率达到p的候选词范围 |
| 传统主导型应用 | Traditional-Centric Application | /trəˈdɪʃənl ˈsentrɪk ˌæplɪˈkeɪʃn/ | 传统业务是主体,LLM是增强插件的应用形态 |
| 训练 | Training | /ˈtreɪnɪŋ/ | 通过数据迭代优化模型参数 |
| 训练数据 | Training Data | /ˈtreɪnɪŋ ˈdeɪtə/ | 用于训练模型的原始文本集合,是模型学习语言规律的知识来源 |
| 训练样本 | Training Sample | /ˈtreɪnɪŋ ˈsæmpl/ | 模型训练中用到的输入-输出对(输入文本+要预测的下一个Token) |
| 触发率 | Trigger Rate | /ˈtrɪɡər reɪt/ | 衡量Skill被大模型正确触发的概率,描述精准度是核心影响因素 |
| 变换器架构 | Transformer | /trænsˈfɔːrmər/ | 基于注意力机制的深度神经网络架构 |
| 旅行规划智能体 | Travel Planner Agent | /ˈtrævl ˈplænər ˈeɪdʒənt/ | 根据预算、时间和偏好自动规划旅行方案的Agent |
| 思维树 | Tree-of-Thought (ToT) | /triː əv θɔːt/ | 探索多条推理路径并选择最优解的搜索框架 |
| 电车难题 | Trolley Problem | /ˈtrɒli ˈprɒbləm/ | 经典伦理思想实验,常被用于讨论AI的道德权衡 |
| 截断检测 | Truncation Detection | /trʌŋˈkeɪʃn dɪˈtekʃn/ | 通过finish_reason判断回复是否被截断 |
| 两阶段训练范式 | Two-Stage Training Paradigm | /tuː steɪdʒ ˈtreɪnɪŋ ˈpærədaɪm/ | 先预训练后微调的模型开发流程 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 不忠于源 | Unfaithful | /ʌnˈfeɪθfl/ | 生成结果不符合所提供的源文本的性质 |
| 未可靠尾部 | Unreliable Tail | /ʌnrɪˈlaɪəbl teɪl/ | 概率分布的低概率区域,容易产生乱码或不相干词 |
| 用户画像 | User Profile | /ˈjuːzər ˈproʊfaɪl/ | 记录用户旅行偏好和历史数据的持久化信息 |
| 用户角色 | User Role | /ˈjuːzər roʊl/ | 表示用户输入信息的messages角色 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 价值观 | Values | /ˈvæljuːz/ | 判断"好"与"坏"的内在标准,难以枚举定义 |
| 梯度消失 | Vanishing Gradient | /ˈvænɪʃɪŋ ˈɡreɪdiənt/ | 深层网络中梯度随层数增加指数衰减导致早期层无法有效学习的现象 |
| 向量 | Vector | /ˈvektər/ | 一组有序的数字,用于表示词在语义空间中的位置 |
| 向量夹角 | Vector Angle | /ˈvektər ˈæŋɡl/ | 两个向量之间的夹角,余弦相似度即夹角的余弦值 |
| 向量维度 | Vector Dimension | /ˈvektər daɪˈmenʃn/ | 嵌入向量的长度,如768、1536、3072维 |
| 向量模长 | Vector Norm | /ˈvektər nɔːm/ | 向量的长度(L2范数),从原点到向量终点的距离 |
| 向量化 | Vectorization | /ˌvektərɪˈzeɪʃn/ | 将文本转换成数字向量表示的过程 |
| 词表 | Vocabulary | /vəˈkæbjəleri/ | 模型能识别和生成的所有词的集合 |
| Voronoi 单元 | Voronoi Cell | /vəˈroʊnɔɪ sel/ | IVF聚类后向量空间被划分成的区域,查询时搜索最近单元 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 词向量 | Word Embedding | /wɜːrd ɪmˈbedɪŋ/ | 用数值向量表示词的语义,语义相近的词向量距离近 |
| Word2Vec | Word2Vec | /wɜːd tuː vek/ | 2013年Google发布的词向量训练算法,首次展示语义代数性质 |
| 工作记忆 | Working Memory | /ˈwɜːkɪŋ ˈmeməri/ | 临时存放中间计算结果的内在缓存 |
| 中文 | English | 音标 | 说明 |
|---|---|---|---|
| 零样本 | Zero-Shot | /ˈzɪərəʊ ʃɒt/ | 不提供任何示例只给任务描述的情境学习形式 |